문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 통계적 방법/분석/분산분석 (문단 편집) == [[분산분석]]의 기법 == '[[통계적 방법|방법으로서의 통계]]' 라는 관점에서 분산분석(ANOVA; Analysis of Variance)은 [[실험|실험법]]과 아주 잘 어울리며, [[사회과학]] 및 보건학, 복지학 등 각종 응용분야에서도 폭넓게 사용되고 있는 대중적인 분석기법이다. 특히 [[실험설계]]에 엄격하게 입각할수록 분산분석에 깊이 의지하게 되고, 실험을 계획하는 석사과정 [[대학원생]]들도 하술될 공분산분석과 혼합설계 분산분석 중의 하나로 학위논문을 쓰게 된다. 게다가 분석논리 역시 직관성이 높으니, [[사회통계]] 커리큘럼을 담당하는 강사나 교수들 역시 통계분석을 소개할 때 분산분석부터 소개하는 경우가 적지 않다. 분산분석은 원칙적으로 말하자면 기존의 독립표본 t-검정만으로는 대응이 어려운 상황에서 설득력 있는 분석논리를 제공하기 위해 사용된다. 독립표본 t-검정이 2개 집단의 평균 비교를 위해 실시된다는 것을 상기해 보자. 만일 비교할 대상 집단이 3개가 된다면, 이들을 한번에 t-검정할 수는 없고 둘씩 짝지어서 세 번 검정하는 것만이 가능하다. 그런데 만일, 예컨대 집단이 50개로 늘어났다면 어떨까? 물론 이 많은 집단들을 일일이 다 t-검정을 반복하면서 비교하는 것은 굉장한 시간낭비다. '''집단이 3개, 4개뿐만 아니라 몇 개가 되든지간에''' 무조건 싹 모아서 한번에 분석할 수 있는 도구가 필요하다. 그런데 문제는 단순히 분석의 효율성에만 그치는 것이 아니다. 더 큰 문제는, 이런 식으로 자꾸 비슷비슷한 검정을 반복하다 보면 '''어느 순간 1종 오류가 과소추정될 가능성이 높아진다'''는 데 있다. 이것을 '''다중비교 문제'''(multiple comparisons problem) 혹은 '''어디서든 효과'''(look-elsewhere effect)라고 부른다. [[xkcd]]가 [[https://xkcd.com/882/|만화]]로 들었던 예를 다시 가져와 보자. [[젤리빈]]이 여드름을 유발한다는 가설이 있고, 젤리빈을 통째로 분석했을 때는 아무런 관계가 없는 것으로 나타났다. 그런데 젤리빈들을 색깔별로 나누어서 일일이 다 따로따로 분석하기 시작하자, [[녹색|어떤 하나의 색]]에서 갑자기 p-값이 0.05 밑으로 내려가는 유의한 결과가 얻어졌다. 그렇다면 녹색 젤리빈만 조심하면 되는 것일까? 그렇지 않다. 같은 분석을 죽치고 반복하다 보니 우연히 녹색 표본에서 하나 얻어걸렸을 뿐이다. 해당 만화에서 마우스를 올렸을 때 자동으로 띄워지는 텍스트에서도 지적하듯, [[재현성]] 같은 건 기대할 수 없다. 잘못된 대립가설을 채택하고 참인 영가설을 기각할 확률이 바로 p-값의 의미인데, 그 p-값이 제 일을 하지 못한 것이다. p-값이 분석가를 배신(?)할 확률을 가리켜 '''가족별 오류율'''(family-wise error rate)이라고도 한다. 결국 둘씩 묶어서 분석할 집단이 많아질수록 대응표본 t-검정은 힘을 잃는다. 단순히 분석가 편하라고 나온 것이 분산분석이 아니라, 수많은 집단 간의 평균을 한번에 비교하는 것이 통계적으로 그만큼 필요했기에 분산분석을 쓰게 된 것이다. 이 부분을 알아야 분산분석에 늘 감초처럼 따라오는 '''사후분석'''(post-hoc analysis)에 대해서도 함께 이해할 수 있다. 분산분석만 가지고는 모든 집단들이 다 통계적으로 차이가 없다는 결론이 나오면 문제 해결이지만, 어딘가에서 통계적으로 차이가 존재한다는 결론이 나오면 분석이 완료되지 않는다. 그때 실시할 사후분석이 어떤 의미인지 이해하려면, 기존의 검정법만으로 믿을 만한 분석결과가 나오지 않는 이유를 유념하고 있어야 한다. 아래에는 가능할 경우 간단한 보고례를 함께 첨부하였으나, 구체적인 보고의 양식은 학문분야마다 다를 수 있음에 유의. 실제로 《Essentials of Statistics for the Behavioral Sciences》 등의 국내·외 통계 교과서들은 분석 결과를 어떻게 보고할지에 대해서 간략한 사례를 함께 첨부하는 경우가 많다. 또한 [[사회통계]] 커리큘럼에 흔히 포함되는 기초 분석기법들은 ★ 표시로 구분하였다.저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기